#AI GPU | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#AI GPU

🎯CPO全倒竟是「最後上車機會」！Line@連結：https://lin.ee/mua8YUP🎯今天CPO族群突然大回檔。今天很多人嚇到了。盤面一堆人開始問：「是不是行情結束了？」江江只講一句話。不是結束，是上車機會。👉如果把AI伺服器想像成一座城市。GPU是發電廠。而資料傳輸的高速公路，就是光通訊。但現在問題來了。AI算力暴衝的速度，已經快到「高速公路開始塞車」。所以全球科技巨頭正在做一件事：把電變成光。這就是最近最火的關鍵字：CPO、矽光子。連AI霸主NVIDIA都直接砸錢下場。市場最新消息是：輝達聯手Coherent、Lumentum準備投入40億美元打造下一代AI資料中心光通訊架構。意思很簡單：AI下一場戰爭，不是晶片，是光。也因為這件事，最近只要掛上「矽光子」三個字⚠️但今天發生一件很關鍵的事。CPO族群出現大回檔。很多散戶看到大跌就慌。但我們看到的東西完全不同。我看到的是：主力在換手。大行情在洗人。因為真正的大機會從來不是在暴漲那一天。而是恐慌拉回。現在市場滿山遍野都在講矽光子。但真正「含金量」最高的公司其實不多。👉3363上詮就是「含金量」超高的漲倍潛力股之一CPO最關鍵的一個零件叫：FAU（光纖陣列元件）簡單講就是把光纖精準接到晶片上的「神經接口」。而台灣有一家公司早就卡在最核心的位置。它不只是供應鏈。它是台積電矽光子朋友圈的核心。這家公司最厲害的技術是：20/40/80通道FAU通道越高技術門檻越高而價格不是線性增加。是跳躍式爆增。換句話說：未來CPO只要放量毛利率會像坐火箭。更重要的是時間點。2025：產品驗證2026：開始貢獻營收2027：AI資料中心全面升級現在就是風雨來臨前的安靜時刻。所以今天CPO的大回檔我只講一次：這可能是今年唯一一次可以舒服卡位CPO的機會。🔴接下來我們會在粉絲團持續幫大家鎖定+追蹤，若還不知道該如何操作？那建議你務必要鎖定江江在Line @，將有更進一步的訊息給大家了解。https://lin.ee/mua8YUP🔴想了解還未起漲的市場主流，同步了解大盤多空轉折點及學習預測技術分析，江江YT節目都會持續追蹤+預告。https://reurl.cc/02drMk********************************************************有持股問題或想要飆股→請加入Line：https://lin.ee/mua8YUP江江的Youtube【點股成金】解盤：https://reurl.cc/02drMk*********************************************************(本公司所推薦分析之個別有價證券無不當之財務利益關係以往之績效不保證未來獲利投資人應獨立判斷審慎評估並自負投資風險)

杭州簽約重磅GPU項目

2月28日，杭州市“爭創全國人工智慧創新發展第一城暨建設一流創新生態推進大會”在杭州市民中心舉行，在本次大會的重大項目簽約環節，12 個投資額超10億元的人工智慧（AI）領域重大項目簽約落地，總投資額達255億元。其中，中國國產全端自研人工智慧算力晶片企業——浙江曦望智能科技股份有限公司的曦望（Sunrise）“高性能 GPU 及推理晶片研發項目”作為本次簽約中唯一的 AI 推理 GPU 晶片項目、杭州“算力築基”工程的核心落地載體正式落戶。△曦望Sunrise 聯席CEO王湛（左二）參與簽約儀式曦望聯席CEO 王湛在簽約現場表示：“決定未來產業發展的，不僅是模型能力本身，更在於能否讓算力成為支撐千行百業智能化升級的真正底座。杭州爭創全國人工智慧創新發展第一城的核心戰略，為我們提供了最好的發展土壤。此次投資簽約，是曦望與杭州共同邁向‘第一城’目標的堅定承諾。”曦望也通過官方微信公眾號發文稱，此次簽約標誌著曦望在杭州的佈局進入全新階段，該項目將以重大投資助力杭州夯實人工智慧算力底座，深度融入城市人工智慧創新體系建設，為杭州核心戰略貢獻關鍵產業力量。資料顯示，曦望前身是商湯大晶片部門，2024年底分拆獨立營運，專注於高性能GPU及多模態場景推理晶片的研發與商業化。公司研發團隊憑藉8年技術沉澱、20億研發投入及兩代量產晶片的工程化驗證，已成為中國國產GPU替代的核心力量。公司致力於為千行百業提供成本降低10倍、能效比突破的智能算力基石，通過技術創新和深度產業協同，推動各行業的智能化發展，並助力實現通用人工智慧（AGI）的普惠化目標。據介紹，作為中國領先的 AI 推理 GPU 晶片及全端解決方案提供商，曦望 Sunrise 是浙江省首家，也是中國首家“All-in 推理”並實現萬卡級規模化交付的全端自研 GPU 晶片公司。 (芯智訊)

🎯黑天鵝來了？別鬧了！這次又是老天送你的「大買點」！Line@連結：https://lin.ee/mua8YUP🎯黑天鵝來了？美股重挫＋美伊戰火升溫。結果呢？台股開低走高CPO族群更是直接噴給你看。上週我就講得很白⭕日周月沒背離⭕融資落後大盤20%⭕量能沒崩⭕35579不是天花板真正過熱的是60分線，不是大趨勢。這種回檔，叫「深呼吸」，不叫「崩盤」。再看基本面。AMD直接接下Meta千億美元級AI大單，6GW Instinct GPU部署。一週前才掃NVIDIA GPU。科技巨頭仍在搶算力。🔥跟著江江鎖定：五大「翻倍級」成長產業第一，CPO。台積電＋NVIDIA都公開點名。新竹實驗室已動。2026商轉、2027爆發。這不是題材，是結構革命。第二，PCB高階板。AI伺服器越做越複雜，ABF載板就是印鈔機。資本支出敢開，就是訂單看到未來。第三，記憶體。HBM滿載，報價翻正。景氣循環已翻多，只是很多人還沒醒。第四，低軌衛星。SpaceX、Amazon Kuiper在加速。軍工＋商用雙引擎，這條線很長。第五，機器人。3月輝達GTC要來了。AI落地的最後一哩路，資金會找低基期。🔴這波拉回，我優先鎖定的是哪一條主線。接下來我們會在粉絲團持續幫大家鎖定+追蹤，若還不知道該如何操作？那建議你務必要鎖定江江在Line @，將有更進一步的訊息給大家了解。https://lin.ee/mua8YUP🔴想了解還未起漲的市場主流，同步了解大盤多空轉折點及學習預測技術分析，江江YT節目都會持續追蹤+預告。https://reurl.cc/02drMk********************************************************有持股問題或想要飆股→請加入Line：https://lin.ee/mua8YUP江江的Youtube【點股成金】解盤：https://reurl.cc/02drMk*********************************************************(本公司所推薦分析之個別有價證券無不當之財務利益關係以往之績效不保證未來獲利投資人應獨立判斷審慎評估並自負投資風險)

AI圈迷上瘋狂“煉金術”

最新跡象顯示，海外科技公司正越來越多地轉向以晶片為抵押的貸款來籌集資金，用於它們龐大的AI投資。這些晶片正是訓練其大型語言模型的核心。此類貸款往往以GPU作為抵押，並由科技集團的租賃協議提供擔保，在AI軍備競賽中廣受歡迎。該行業目前每年都會在晶片領域耗資數千億美元，儘管這些晶片往往很快就會過時。而越來越多的投資者眼下也正被高達7%-17%左右的誘人收益率所吸引，這類貸款收益率通常高於科技公司自身發行的債務。“投資者非常興奮，”King & Spalding律師事務所專門從事金融與重組業務的合夥人David Ridenour表示，“人們甚至願意接受‘概不議價’的條款，擠破頭也要擠進這些GPU交易中。”GPU融資徹底火了自2023年末雲端運算服務商CoreWeave開創先河以來，隨著高端晶片需求激增與價格飆升，GPU抵押債務正日益普及。據花旗集團估算，GPU及配套伺服器可佔資料中心項目總成本的30%至40%。此類貸款通常由科技公司和投資機構設立的特殊目的載體(SPV)承接，用於批次採購高性能晶片，隨後租賃給科技企業用於訓練人工智慧模型。這種安排使得債務規模迅速增長的大型科技集團，能夠將這些貸款從其公司資產負債表中剝離。上月，阿波羅宣佈為Valor Equity Partners管理的數字基礎設施基金提供35億美元融資方案，該基金將購入輝達的GB200晶片並租賃給馬斯克旗下的xAI公司。人工智慧雲服務提供商IREN Limited本月早些時候也從高盛和摩根大通獲得36億美元貸款承諾，用於採購與微軟AI合同相關的晶片。據熟悉GPU融資的律師透露，此類交易中貸款方往往需迅速行動並開出大額支票。“大型機構基本會這樣問：‘你是否願意參與一個兩周內結項的交易，並投入幾億美元？’”該律師表示。而此類貸款的日益盛行，也凸顯了投資者對資產擔保型融資的渴求——銀行與私募信貸基金正尋求以穩定現金流為擔保的特殊債務。這些交易通常會包含一項“不可撤銷條款”（hell or high water），防止科技公司提前終止租賃。這有助於降低因AI技術快速演進導致GPU過時的風險。最大風險：GPU折舊？然而，部分投資者仍擔憂GPU的經濟壽命可能短於預期，且由於該新興產業缺乏價格歷史資料，老舊AI晶片的市場價值往往存疑。一些投資者還表示，目前的估值也可能因短期晶片供應短缺而被人為推高。橡樹資本結構化信貸策略主管Jen Marques強調：“我們必須確保GPU的使用壽命遠超投資攤銷周期。”一位多次拒絕GPU融資提案的投資者坦言：“這類裝置往往三年內就會過時，這簡直是場豪賭。”該投資者進一步指出：“（違約後）轉售幾年前的GPU，就像是在鞭打一匹死馬(意指徒勞無功)。”“這是一個非常新的領域，很多人都在努力應對GPU壽命的問題，”A&O Shearman律師事務所美國能源、基礎設施與自然資源聯席主管Dorina Yessios則表示，“這必須納入承銷考量，就像其他裝置融資一樣。”目前，三大評級機構之一的穆迪也已開始對GPU擔保債務進行評級，並聲明一旦基礎租賃期結束，它就會撤銷信用評級。穆迪全球項目與基礎設施融資團隊的高級副總裁John Medina表示，“通常情況下，我們評級的交易在首個租賃期內就會償還所有資金，因此你無需考慮(GPU)使用壽命的期限。” (財聯社AI daily)

曾經高不可攀的H100 GPU，如今1.5折在平台出售，是什麼泡沫破了？

舊時王謝堂前燕？金融博主twi@HedgieMarkets 的一條推文引發了討論，曾經曾經售價高達 40,000 美元（約合 29 萬人民幣）的 H100，目前在 eBay 等二手平台上的成交價已跌至 6000 美元（約合 4.3 萬人民幣）左右，這些並不是像鹹魚上的壞件，而是真實可用的顯示卡。四年間，這一尖端人工智慧加速器跌幅高達 85%。為什麼 H100 跌得這麼慘？這並非因為其性能絕對值變弱了，而是因為在 AI 推理的戰場上，它的單位成本已經讓它被淘汰。原推文中提到，採用H100進行模型推理（也就是我們給模型提示詞，然後它們輸出內容）的成本約是新一代 Blackwell (B300) 的 11 倍。實際上，這個倍率還是綜合的保守數字，在semianalysis給到的資料中，GB200 NVL72在FP4性能上提高了98倍，這其實也是為什麼牢黃一直說“買的越多，省的越多”。經濟學家David McWilliams在接受《財富》採訪時表示，“對圖形處理器（GPU）的大規模投資存在問題，因為它就像【數字生菜】，很快就會枯萎——你投資的是一種易腐爛的商品。”這些尖端的GPU實際上在安裝進機房的同時就開始貶值。而對於追求極致效率的算力服務商來說，在看到新一代硬體以多倍效率碾壓姿態登場時，繼續持有 H100 意味著每跑一秒鐘都在虧錢，因為對手正用著營運成本僅為數十分之一的新一代硬體。實際上，這一現象也在揭開各大巨頭財報中的隱憂，各家科技巨頭們正在通過將這些 GPU 的折舊時間延長至 5-6 年，來掩蓋真實的資產貶值損失。然而，現實是殘酷的，輝達現在維持著“一年一更”的瘋狂節奏。當 Blackwell 甚至即將到來的 Rubin 架構以數倍的性能跨度入場時，那些帳面上還值數萬美元的 H100，在二手市場上其實只值一輛二手車的價格。這種帳面價值與市場價值的巨大鴻溝，已成為未來財報中巨額資產減值的伏筆。那既然貶值如此之快，為什麼微軟、Meta、Google等巨頭依然在源源不斷地訂購 B200 甚至還未出爐的Rubin？即使這些訂單在交付時可能就已經“過時”了？事實就是，時間才是這場競爭中的唯一硬通貨，在大模型競賽中，晚半年拿到算力可能意味著錯過整個時代。而在這些資料中心的基建中，也存在著客觀慣性，現代化資料中心的液冷設施和電力配額是提前相當長周期規劃的。即便 Rubin 更好，現在的機房只能跑 B200或者更老的H200。同時，持續購買當下的產品，往往是獲取下一代產品（如 Rubin/Feynman）優先供應權的“投名狀”。這釋放了一個什麼訊號？在提供那些二三線的雲服務商中，如果是加槓桿炒作算力，顯然要因為頂層競爭神仙打架（燒錢）的快速迭代而面臨破產洗牌。而由於這些曾經的頂級晶片快速淘汰，對中小企業和學術界是極大的利多。頂級算力正在從“奢侈品”變成“通用物資”，這預示著 AI 應用將迎來真正的爆發。或許我們再過四年五年，這些曾經高不可攀的算力晶片就會成為“大船貨”，以極其低廉的價格，成為我們垃圾佬的“二奶機”“三奶機”的一部分，搭建本地的家用算力伺服器。 (AMP實驗室)

CPO：AI 算力爆發下的通訊革命，美股 A 股受益標的全解析

當 AI 大模型訓練進入千億參數時代，GPU 叢集的通訊效率成為算力突破的關鍵瓶頸。傳統光模組就像 “外接 U 盤”，雖能滿足基礎資料傳輸，但在超大規模叢集中面臨功耗高、latency高、頻寬不足的痛點。而CPO（Co-packaged Optics，共封裝光學）技術的出現，如同將 “U 盤” 直接整合到 “主機板”，徹底重構了 AI 資料中心的 interconnect 架構，成為開啟下一代通訊革命的核心鑰匙。一、CPO 到底是什麼？—— 從 “外接” 到 “內建” 的通訊升級簡單來說，CPO 技術是將光學引擎與交換機 ASIC 晶片直接封裝在一起，讓光訊號無需經過傳統的電纜和連接器傳輸，直接在晶片層面完成光電轉換與資料交換。如果把資料中心的通訊網路比作城市高速公路網，傳統光模組相當於 “長途收費站”，資料傳輸需多次轉換訊號、排隊等待；而 CPO 就像 “城市快速路直達系統”，跳過中間環節，實現資料 “門到門” 高效傳輸。與傳統光模組相比，CPO 的核心優勢體現在三個維度：功耗革命：傳統 800G 光模組每連接埠功耗約 16-18W，而 CPO 通過縮短互連距離，功耗可降至 5pJ/bit，僅為傳統方案的 1/4，完美解決超大規模叢集的散熱難題；頻寬躍升：單晶片封裝整合多個光引擎，Nvidia Quantum X800 CPO 交換機已實現 115.2Tb/s 的交換容量，是傳統交換機的數倍；成本最佳化：減少了 DSP 晶片、連接器等中間元件，長期來看可降低 30% 以上的綜合部署成本，同時節省機房空間。二、CPO 的核心技術：三大支柱撐起通訊革新CPO 並非單一技術突破，而是光學、晶片、封裝三大領域的協同創新，核心技術包括三大支柱：1. 矽光子學（SiPh）：通訊的 “矽基底座”矽光子學是 CPO 的核心載體，它利用 CMOS 工藝將雷射器、調製器、探測器等光電器件整合到矽基晶片上，就像在矽片上搭建 “光訊號高速公路”。與傳統 InP 基光器件相比，SiPh 具有成本低、功耗小、可大規模量產的優勢，更適合與半導體晶片協同封裝。目前 SiPh 在 800G/1.6T 光模組中的市場份額已從 2018 年的 10% 飆升至 2024 年的 33%，預計 2026 年在 1.6T 領域佔比將達 60-70%。2. 共封裝整合：打破 “光 - 電” 壁壘共封裝技術是 CPO 的靈魂，核心是將光學引擎與交換機 ASIC 晶片的距離縮短至 50mm 以內（傳統方案為 150mm 以上）。這種 “貼身設計” 減少了電訊號傳輸損耗，避免了傳統方案中訊號在光模組與晶片間的多次轉換。Nvidia 的 Quantum X800 CPO 交換機採用 3D 堆疊封裝，將光學引擎直接倒裝在交換機晶片表面，實現訊號零衰減傳輸。3. 關鍵元件突破：FAU 與 CW 雷射CPO 的穩定運行依賴兩大關鍵元件：一是 FAU（Fiber Array Unit，光纖陣列單元），負責將多路光訊號精準匯入晶片，相當於 “光訊號分配器”，蘇州 TFC 是全球核心供應商；二是 CW（Continuous Wave）雷射，作為矽光子 transceiver 的光源，解決了傳統 EML 雷射晶片的供應短缺問題，Lumentum、Sumitomo Electric 是主要提供商。此外，薄膜鈮酸鋰（TFLN）調製器、相干光傳輸等技術的突破，進一步提升了 CPO 的性能上限。三、CPO 落地周期：2026-2030 年黃金成長期從技術成熟度到規模商用，CPO 正經歷三階段落地處理程序，目前處於從 “技術驗證” 到 “規模部署” 的關鍵轉折期：1. 萌芽期（2024-2025）：技術驗證與小批次試點2024 年 Broadcom 推出 Tomahawk 5 CPO 交換機（51.2T 交換容量），2025 年 Nvidia 在 GTC 大會發佈 Quantum X800 CPO 交換機，標誌著技術已具備商用基礎。這一階段主要應用於頭部雲廠商的超大規模 AI 叢集試點，Meta、Google、AWS 等已開始小規模部署，市場滲透率僅 1% 左右，CPO 交換機市場規模約 4.25 億美元。2. 成長期（2026-2027）：規模部署與滲透率躍升隨著 1.6T 光模組升級加速，CPO 將迎來規模化商用。Nvidia 計畫 2026 年推出 Spectrum-X 乙太網路 CPO 交換機，支援 102.4Tb/s 容量，可連接 10 萬個以上 XPU；Google TPU v7 叢集也將全面採用 CPO 架構。預計 2027 年 CPO 在 AI 交換機市場的滲透率將達 8%，市場規模突破 53 億美元，年複合增長率超 500%。3. 成熟期（2028-2030）：全面普及與技術迭代2030 年 CPO 滲透率預計將達 20%，成為超大規模 AI 資料中心的標配，市場規模將增至 131 億美元。屆時 CPO 將與 LPO（線性可插拔光學）、OCS（光電路交換）等技術融合，進一步突破傳輸距離限制，支撐百萬 GPU 規模叢集的通訊需求。四、受益標的全解析：美股 A 股核心玩家圖譜CPO 產業價值鏈涵蓋晶片、光學元件、封裝測試、裝置整合等環節，美股 A 股湧現出一批核心受益標的，各自佔據關鍵賽道：美股：技術引領與生態主導Broadcom（AVGO）CPO 晶片絕對龍頭，Tomahawk 6 CPO 交換機支援 102.4T 容量，已進入 Meta、Google 供應鏈，佔據全球高端交換機晶片市場 60% 以上份額；Nvidia（NVDA）CPO 生態主導者，Quantum X800 CPO 交換機已量產，通過 NVLink Fusion 開放生態，帶動產業鏈上下游協同發展；Lumentum（LITE）CW 雷射晶片核心供應商，佔據全球高功率雷射市場 40% 份額，CPO 所需的 100mW/200mW CW 雷射出貨量全球第一；Coherent（COHR）相干光元件龍頭，提供 CPO 所需的光調製器、探測器等核心器件，同時佈局 OCS 技術，形成協同優勢；Corning（GLW）高端光纖與 MPO 連接器領導者，CPO 交換機所需的高密度光纖陣列產品市佔率超 30%，與 Nvidia 深度合作。A 股：元件突圍與細分龍頭中際旭創（300308）全球光模組龍頭，800G/1.6T 光模組市佔率全球第一，CPO 光引擎已完成樣品測試，受益於 1.6T 升級與 CPO 量產雙重紅利，目標價 799 元；天孚通訊（300394）FAU（光纖陣列）全球龍頭，Nvidia Quantum X800 CPO 交換機的核心供應商，CPO 相關產品 2026 年預計貢獻營收 2.32 億元，目標價 243 元；通宇通訊（300570）MPO 連接器與 shuffle box 核心廠商，通過 Corning 進入 Nvidia 供應鏈，CPO 相關產品 2027 年營收佔比將達 12%；長飛光纖（6869.HK）中空光纖（HCF）領導者，中空光纖可降低傳輸 latency 30%，適配 CPO 的長距離傳輸需求，AI 相關業務年增速超 33%；新易盛（300502）1.6T 光模組主力廠商，矽光子技術已量產，CPO 封裝方案與頭部交換機廠商合作開發，有望快速切入全球供應鏈。CPO 作為新興技術，仍面臨三大挑戰：一是技術標準尚未完全統一，不同廠商的封裝方案存在相容性問題；二是高端光晶片、調製器等核心元件仍依賴海外供應，國產替代任重道遠；三是初期部署成本較高，中小資料中心的普及節奏可能慢於預期。但長期來看，隨著 AI 算力需求的指數級增長，CPO 技術的滲透率將持續提升。野村證券預測，2026-2030 年全球 CPO 市場規模 CAGR 將達 127%，成為繼光模組之後，AI 通訊領域最具爆發力的賽道。對於投資者而言，可重點關注具備核心技術壁壘、已進入全球頭部供應鏈的企業，把握從技術驗證到規模商用的黃金投資窗口。在這場 AI 驅動的通訊革命中，CPO 不僅是技術的革新，更是產業生態的重構。當越來越多的企業加入這場 “封裝革命”，資料傳輸的效率邊界將不斷被打破，為 AI 大模型的持續進化提供無限可能。 (老王說事)

對標H100！中國國產GPU“核彈”參數曝光：1000TFLOPS算力，性能直逼Blackwell？

摩爾線程AI旗艦級計算卡MTT S5000性能首次曝光，這是摩爾線程2024年推出的、專為大模型訓練、推理及高性能計算而設計的訓推一體全功能GPU智算卡。摩爾線程在其官網中，首次公佈了S5000的硬體參數：支援FP8到FP64的全精度計算，其單卡AI算力（FP8）最高可達1 PFLOPS，視訊記憶體容量為80GB，視訊記憶體頻寬達到1.6TB/s，卡間互聯頻寬為784GB/s。業內人士表示，MTT S5000實測性能對標H100，在多模態大模型微調任務中，部分性能甚至超越H100。在晶片架構層面，S5000採用第四代MUSA架構“平湖”，專為大規模AI訓練最佳化，依託MUSA全端軟體平台，原生適配PyTorch、Megatron-LM、vLLM及 SGLang等主流框架，讓使用者能夠以“零成本”完成程式碼遷移，相容國際主流CUDA生態。在計算精度方面，S5000作為國內一批最早原生支援FP8精度的訓練GPU，配置了硬體級FP8 Tensor Core加速單元。相比傳統的BF16/FP16，FP8可將資料位寬減半，視訊記憶體頻寬壓力降低50%，理論計算吞吐量翻倍。其FP8引擎全面支援DeepSeek、Qwen等前沿架構，可提升30%以上訓練性能。基於S5000建構的誇娥萬卡叢集已經落地，其浮點運算能力達到10Exa-Flops，在Dense模型訓練中MFU達60%，在MoE模型中維持在40%左右，有效訓練時間佔比超過90%，訓練線性擴展效率達95%。依託原生FP8能力，它能夠完整復現頂尖大模型的訓練流程，其中Flash Attention算力利用率超過95%，多項關鍵指標均達到國際主流水平。在叢集通訊層面，S5000採用獨創的ACE技術，將複雜通訊任務從計算核心解除安裝，實現計算與通訊的零沖突平行，大幅提升模型算力利用率（MFU）。實測顯示，從64卡擴展至1024卡，系統保持90%以上的線性擴展效率，訓練速度隨算力增加幾乎同步倍增。2026年1月，智源研究院基於S5000千卡叢集，完成了前沿具身大腦模型RoboBrain 2.5的端到端訓練與對齊驗證。結果顯示，與輝達H100叢集的訓練結果高度重合，訓練損失值（loss）差異僅為0.62%。除了訓練，S5000在推理場景同樣表現優異。2025年12月，摩爾線程聯合矽基流動，基於S5000完成了對DeepSeek-V3 671B滿血版的深度適配與性能測試，實測單卡Prefill吞吐超4000 tokens/s，Decode吞吐超1000 tokens/s，這一成績刷新了國產GPU的推理紀錄。 (芯榜)

又一AI晶片獨角獸誕生！00後創辦，融資15億元，成立不到2年

首批產品最早明年交付。芯東西2月11日消息，據外媒今日報導，一家由00後創辦的神秘英國AI晶片創企Olix，已獲得2.2億美元（約合人民幣15億元）融資，估值超過10億美元（約合人民幣69億元），躋身獨角獸企業。Olix（此前名為Flux Computing）成立於2024年3月，總部位於英國倫敦，由James Dacombe創辦，計畫開發比輝達GPU更快、更便宜的AI晶片。James Dacombe今年25歲，同時也是英國腦監測創企CoMind的創始人兼CEO。CoMind是他18歲時創立的，並已融資1億美元（約合人民幣7億元）。▲James Dacombe針對AI推理需求，Olix正在打造一種新型AI晶片，目標是高吞吐量和高互動性，以應對最苛刻的推理工作負載，並且不受當今AI晶片的架構和供應鏈限制。Olix光學張量處理單元（OTPU）是一款採用新型儲存器和互連架構的光學數字處理器。其團隊相信，將SRAM架構與光子學相結合，可以在每兆瓦吞吐量和總擁有成本方面超越基於HBM的架構，並且在互動性和延遲方面顯著優於純矽SRAM架構。該公司已累計獲得2.5億美元（約合人民幣17億元）融資。據知情人士透露，Olix希望最早明年向客戶交付首批產品。這家初創公司拒絕就其融資事宜置評。Vertex Ventures普通合夥人、前Facebook基礎設施高管Jonathan Heiliger認為，AI推理需要對晶片的製造方式進行徹底的重新思考，系統級架構的大規模重構極其困難，“James和他的團隊的執行速度比擁有十倍資源的公司還要快。”目前英國晶片公司的融資規模遠遠落後於美國。另一家英國AI晶片創企Fractile昨日宣佈，計畫在未來三年投資1億英鎊（約合人民幣9億元），以擴大在其在英國本土的業務。Olix在官網分享了其晶片設計思路：現有GPU架構已接近物理極限，當前硬體從根本上來說無法同時為每個使用者提供快速推理。這種權衡取捨是自TPUv2和V100以來所有主流加速器改採用的記憶體架構固有的——一個大型邏輯晶片放置在中介層上，旁邊是堆疊的HBM記憶體。只有將大量使用者的資料批次處理，充分利用計算資源，並將模型權重通過HBM傳輸到大量輸出token的能耗分攤，才能實現每個XPU和每兆瓦的高吞吐量。但大批次處理必然會增加每個使用者的延遲，降低互動性，迫使使用者做出艱難權衡。推理性能受限於資料傳輸。因此，邏輯效率（FLOPs/W）和吞吐量（每個封裝的FLOP）的持續提升帶來的收益遞減。資料傳輸時間的縮短受到記憶體牆以及封裝互連邊界長度和封裝尺寸限制的制約。雖然從HBM2到HBM4的過渡在能效和吞吐量密度方面都取得了顯著提升，但要再次實現如此巨大的改進需要近十年時間，並且需要更加複雜和昂貴的製造技術。HBM性能提升帶來的能效提升有限，不可避免限制了每個token傳輸KV cache所需的 pJ/bit 能量，從而也限制了當前架構中token總能耗的下限。過去十年，這種架構擴展提升了系統的整體性能，但進一步擴展無法同時實現高吞吐量和高互動性。從輝達Hopper到Rubin Ultra，封裝尺寸大約增長了4倍。再增長4倍將接近晶圓級封裝的極限。更大的封裝可以縮短資料傳輸時間並提高互動性，但無法降低固定資料傳輸延遲。因此，阿姆達爾定律限制了未來通過進一步增大封裝尺寸來提升互動性的可能性。資料從HBM經由中介層進入計算單元的物理路徑並未發生根本性改變，但隨著跨光罩高頻寬介面的引入，其複雜性卻日益增加。因此，以每次快取命中或未命中時間衡量的資料傳輸延遲已接近或達到極限，並逐漸成為每個token延遲中越來越重要的組成部分。雖然可以通過更大層的張量平行性進一步縮短每層的資料傳輸時間，但這會增加功耗和互連延遲。此外，高吞吐量編碼方案也會引入編碼和解碼延遲，進一步提高每個token的最低延遲，並限制可實現的互動性。如果可以通過規模、整合或執行來解決這一權衡問題，那麼當今計算生態系統的核心企業將是做這件事的主體。由於預付了數十億美元以確保獲得領先的邏輯節點、HBM和先進封裝能力，這類公司將在軟體、系統整合和供應鏈方面擁有巨大的護城河。每一代都加倍強化這種方法。系統規模越來越大，整合度越來越高，目標也越來越遠大。絕對性能持續提升，但底層限制卻始終不變，因此仍然無法同時實現高互動性和高吞吐量。能夠同時提供高吞吐量和高互動性的硬體，必須同時解決大規模資料傳輸效率和延遲問題。任何僅改善其中一個維度的方法都只是改變了權衡的本質。Olix團隊認為，從供應鏈和製造角度來看，新的架構必須放棄高密度金屬薄膜（HBM）、先進封裝或其他任何受現有廠商供應鏈限制的技術。即便是最大的超大規模資料中心營運商都難以確保產能，初創公司根本無法與之競爭。從相容性角度來看，硬體必須支援現有模型。它不應強制要求現有模型具備量子算術能力/物理理論能力，也不應要求採用新的熱力學神經擬態架構，即使這種架構承諾在理論上有所改進。從設計角度來看，實現這一目標需要系統級思考，從光罩級和晶圓級設計轉向機架級計算和資料傳輸的協同設計，將其作為一個單一的統一系統。這個領域不乏資金雄厚的挑戰者，但他們都陷入了同樣的兩種失敗模式。有些晶片仍然採用邏輯晶片-中介層-HBM架構範式，並且在與新一代GPU/TPU競爭時，仍面臨同樣的互動性-吞吐量權衡，而這些GPU/TPU採用的是老一代低端HBM和邏輯晶片。另一些則做得不夠。他們認識到需要一種新的範式，試圖重新塑造互動性的權衡取捨，但無法擺脫這種權衡取捨，仍然受到僅限矽基方法的侷限性的制約。Olix團隊希望擺脫這些限制，創造前沿AI的下一個範式。 (芯東西)